رتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
- author معین شهبازی
- adviser علی محمد زارع بیدکی ولی درهمی
- Number of pages: First 15 pages
- publication year 1392
abstract
با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مقابله با صفحات فریب آمیز ارائه شده اند که به دو دسته کلی الگوریتم های براساس محتوا و الگوریتم های براساس پیوند تقسیم می شوند. دسته اول با تجزیه و تحلیل محتوای اسناد توانایی تشخیص و مقابله با صفحات فریب آمیز را دارند. همچنین در دسته دوم با تجزیه و تحلیل پیوند و رفتار بین صفحات عمل مقابله و تشخیص انجام می شود. مشکل اصلی الگوریتم های مبتنی بر محتوا، نادیده گرفتن پیوندهای بین صفحات است. در مقابل در الگوریتم های براساس پیوند تشخیص الگوهای غیرطبیعی در میان گراف های بزرگ از چالش های این الگوریتم ها است. هدف اصلی این پایان نامه، ارائه یک روش رتبه بندی ترکیبی به منظور مقابله با صفحات فریب آمیز است. در این روش با ترکیب الگوریتم های مختلف رتبه بندی سعی می شود رتبه صفحات فریب آمیز پایین کشیده شود. با توجه به کارایی پایین روش های پایه ای موجود در مقابله با این پدیده روش پیشنهادی سعی می کند با دخیل کردن یادگیری ماشین در فرآیند رتبه بندی بهبود نسبی در کارایی روش مبنا بوجود می آید. در این روش سعی می شود هر چه بیشتر پویایی گراف وب با استفاده از روش های یادگیری مدل شود. فرآیند یادگیری جهت ترکیب رتبه های مختلف با استفاده از مشاهدات و دانش قبلی می باشد که در این حالت روش پیشنهادی دارای کارایی و دقت بیشتری نسبت به روش موجود می باشد.
similar resources
ارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی
امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد...
15 صفحه اولدسته بندی صفحات وب برای پالایش
مسئل? حفاظت از اقشار آسیب پذیر جامعه در مقابل موارد ناهنجار در صفحات وب، موجب احساس نیاز به پالایش صفحات وب شده است. یکی از جنبه های پالایش صفحات وب که امروزه بیش از پیش مورد توجه قرار گرفته است، طبقه بندی صفحات بر اساس میزان خشونت آمیز بودن آن ها است. طبقه بندی در واقع نسبت دادن یک صفحه به یک یا چند موضوع از پیش تعیین شده با استفاده از الگوهای آموزش داده شده می باشد. سیستم با استفاده از یک سری...
15 صفحه اولبهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش ...
full textرتبه بندی رأسهای گراف
یک مسئلۀ مهم در نظریۀ گراف، علوم کامپیوتر و شبکه های اجتماعی، مشخص کردن اهمیت رأس های یک گراف (یا گره های یک شبکه) است. بدین منظور، معیارها و روش های گوناگونی پیشنهاد شده است. یکی از این روش ها، رتبه بندی است که بر پایۀ گا م برداریِ تصادفی بنا شده است. هدف ما در این مقاله، توضیح الگوریتم رتبه بندی به دو شکل متمرکز و توزیع شده است. به این منظور، نخست مفهوم رتبه بندی و الگوریتم محاسبۀ آن را به صور...
full textالگوریتم ژنتیک با جهش آشوبی هوشمند و ترکیب چندنقطهای مکاشفهای برای حل مسئله رنگآمیزی گراف
Graph coloring is a way of coloring the vertices of a graph such that no two adjacent vertices have the same color. Graph coloring problem (GCP) is about finding the smallest number of colors needed to color a given graph. The smallest number of colors needed to color a graph G, is called its chromatic number. GCP is a well-known NP-hard problems and, therefore, heuristic algorithms are usually...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023